iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 8
0
Google Developers Machine Learning

Google Developers Machine Learning 學習系列 第 8

【Day 08】How Google does Machine Leaning (How Google does ML -1)

  • 分享至 

  • xImage
  •  

前言

這章希望可以加快速度!!!!

主題

2.0 ML Surprise

https://ithelp.ithome.com.tw/upload/images/20190909/20120188GOmguNIToo.png
https://ithelp.ithome.com.tw/upload/images/20190909/20120188JHCn5uvVA0.png
機器學習的驚喜!?這些課程的名稱都命名的很文藝,讓人無法一眼看穿要講些什麼內容。
所謂的驚喜說穿了就是有別於一般人預期整個流程的時間分配,講者將流程分為幾部分:

  • Define KPI's: 訂定績效指標,就是將整體ML專案的目標確立。
  • Collecting data: 蒐集資料。
  • Building infrastructure: 建設基礎設施,這感覺很廣泛,可能包含機器學習的訓練環境、自動化資料流的程式等等。
  • Optimizing ML algorithm: 最佳化ML演算法,這就是訓練模型的部分。
  • Integration: 整合,將ML演算法整合進專案的應用中。
    大部分的人可能預期在訓練模型上要花許多時間,或許和硬體廠商不斷主打運算速度導致的迷思,實際上,比起訓練模型,蒐集資料會佔掉更多更多的時間。的確如此,因為,許多資料的蒐集往往不如想像中的容易,可能資料取得不易、資料沒有固定格式、資料格式不易轉換成row data、甚至資料沒有被數位化,這些都是影響資料蒐集要花上大筆時間的可能因素。
    第二項需要花費大量時間的部分是建設基礎設施,其實也是非常好理解的,光是在自己電腦上建構機器學習的開發環境,常常就會因為硬體、OS、軟體等版本間的相依性,導致遇上很多問題,更別說要建構出能夠重複開發、自動化訓練、測試驗證的穩定環境,的確會耗費掉大量時間(除非你使用GCP,我猜後面章節一定會這樣提到)。
    而大家最愛的訓練模型部分,出乎意料佔了開發流程中較少的時間,的確如果有優良且大量的資料集,又有穩定的開發環境,訓練模型的門檻將會大大降低,所以反而不需要花費太多時間。
    當然,這一切皆源自於Google經驗!!!

上一篇
【Day 07】How Google does Machine Leaning (What it means to be AI first -5)
下一篇
【Day 09】How Google does Machine Leaning (How Google does ML -2)
系列文
Google Developers Machine Learning 學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言